假尿苷 ( Ψ ) 修饰 是 RNA 中丰度最高的修饰之一,广泛存在于 tRNA、rRNA、snRNA 及 mRNA 中,通过改变 RNA 的二 级结构、稳定性或与蛋白的互作,调控翻译效率、RNA 剪切等关键过程,在细胞应激、发育及疾病中发挥核心作用。从早期的全转录组初筛,到临床样本的定量分析,再到高分辨率的密集位点解析,直至单分子层面的原生 RNA 探究,Ψ-seq/Pseudo-seq、BID-seq、BACS 与纳米孔技术依次构建起 Ψ 修饰研究的技术阶梯。本文将介绍这四类主流技术的原理、实验流程及优劣势。
(一)Ψ-seq/Pseudo-seq
核心依赖 CMC(N - 环己基 - N'-(2 - 吗啉乙基) 碳二亚胺甲基对甲苯磺酸盐)特异性标记 :CMC 可与 RNA 中的 U、G 和 Ψ 形成加合物,经碱性条件处理后,仅 Ψ-CMC 加合物稳定保留,其余加合物被逆转。Ψ-CMC 加合物会阻碍逆转录酶(RT)前进,导致 RT 在 Ψ 位点下游 1 个核苷酸处终止,通过高通量测序检测这些终止位点,对比 CMC 处理组(+CMC)与未处理组(-CMC),筛选出 CMC 依赖的特异性终止信号,即为 Ψ 位点。
1.样本制备与 RNA 提取:从酿酒酵母等样本中提取总 RNA,通过 oligo (dT) 纤维素珠富集 poly (A)+ RNA(适配 mRNA 检测)。
2.RNA 碎片化:用氯化锌随机断裂 RNA 为 60-150 nt 片段,确保转录组均匀覆盖。
3.CMC 标记与加合物逆转:+CMC 组用 0.5 M CMC 处理 RNA,-CMC 组用缓冲液替代;后续经碱性条件孵育,去除 U-CMC 和 G-CMC 加合物,仅保留 Ψ-CMC。
4.文库构建:修复 RNA 3' 末端环状磷酸基团,连接 3' 接头,进行逆转录合成 cDNA,凝胶纯化筛选截短 cDNA(对应 RT 终止产物),经环化和 PCR 扩增获得测序文库。
5.测序与数据分析:Illumina 平台测序后,通过 barcode 拆分、 adapter 修剪、基因组比对,识别 + CMC 组特有的 RT 终止位点,确定 Ψ 在转录组中的位置。
1.首次实现全转录组 Ψ 位点定位,可发现 mRNA、rRNA、tRNA 等多种 RNA 中的 Ψ 修饰,为 Ψ 功能研究奠定基础。
2.达到单核苷酸分辨率,能精准确定 Ψ 在 RNA 序列中的具体位置。
3.适配性广,可调整流程用于不同物种(只要能获得高质量 mRNA)。
1.无绝对定量能力:仅能定性判断 “是否存在 Ψ”,无法检测修饰比例(如 30%、70%)。
2.样本量需求高:需至少 2 μg poly (A)+ RNA,难以适配微量样本。
3.流程繁琐:涉及多步化学处理、凝胶纯化,操作复杂度高,易导致 RNA 损耗。
4.存在假阳性风险:RNA 二级结构等因素可能导致非特异性 RT 终止,需依赖多生物学重复(建议≥14 个)过滤。
5.无法区分连续 U 中的 Ψ:对密集修饰区域的检测效果受限,且不兼容低丰度 RNA 的精准分析。
(二)BID-seq
中性 pH 条件下亚硫酸氢盐可与 Ψ 定量反应形成 Ψ-BS 加合物,且不引发胞嘧啶(C)脱氨基(避免序列复杂性丢失)。Ψ-BS 加合物会导致逆转录酶(SuperScript IV)在修饰位点发生 “跳跃读取”,使 cDNA 对应位置出现碱基缺失;对比亚硫酸氢盐处理组(+BS)与未处理组(-BS),筛选出 BS 依赖的特异性缺失信号,即为 Ψ 位点,且缺失率与 Ψ 修饰比例正相关,可实现定量。
1.样本制备与 RNA 提取:从细胞或组织中提取总 RNA,富集 poly (A)+ RNA(适配 mRNA 检测),仅需 10–20 ng 输入 RNA。
2.RNA 预处理:将 RNA 片段化为适合测序的片段,修复 3' 末端环状磷酸基团,连接 5' 和 3' 测序接头。
3.亚硫酸氢盐修饰:+BS 组用优化后的亚硫酸氢盐试剂(2.4 M Na₂SO₃ + 0.36 M NaHSO₃)70℃孵育 3 小时,形成 Ψ-BS 加合物;-BS 组用缓冲液替代,作为对照。
4.文库构建:经脱硫、逆转录合成 cDNA(SuperScript IV 酶),PCR 扩增后纯化测序文库。
5.测序与数据分析:Illumina 平台测序后,通过比对基因组、计算缺失率,结合校准曲线(基于已知 Ψ 比例的合成 RNA),确定 Ψ 位点及修饰比例。
1.兼具单碱基分辨率与绝对定量能力:可精准定位 Ψ 位置,同时通过缺失率计算修饰比例(如 10%、50%),解决传统技术仅能定性的局限。
2.样本量需求低:仅需 10–20 ng RNA,适配微量样本(如临床活检组织、小鼠组织)。
3.序列复杂性保留:中性 pH 条件避免 C 脱氨基,不影响 RNA 序列完整性,减少 mapping 困难。
4.覆盖范围广:可检测 mRNA、rRNA、tRNA 等多种 RNA 的 Ψ 修饰,且能识别组织特异性 Ψ 位点。
1.特定序列背景存在干扰:部分含 ACΨ、CUΨ 等 motif 的未修饰 RNA 可能出现 10–25% 的背景缺失率,需通过严格筛选标准排除假阳性。
2.密集修饰区域检测受限:相邻 Ψ 位点可能因 “信号遮蔽” 导致低修饰比例位点漏检。依赖校准曲线:不同序列 motif 的 Ψ-BS 反应效率有差异,需通过合成 RNA 探针构建校准曲线,增加实验复杂度。
(三)BACS
利用 Ψ 独有的游离 N¹ 原子,与 2 - 溴丙烯酰胺发生加成反应,随后通过分子内 O²- 烷基化形成稳定的 nce¹,²Ψ 环化产物;未修饰的尿苷(U)因无游离 N¹,无法发生该反应,实现 Ψ 的特异性标记。nce¹,²Ψ 产物在反转录(RT)过程中碱基配对特性改变,不再与腺嘌呤(A)常规配对,而是被反转录酶识别为胞嘧啶(C),最终在 cDNA 中产生U-to-C 的特异性突变信号,通过突变率可直接定量 Ψ 的修饰水平。
1.RNA 样本预处理:提取总 RNA / 核糖体 RNA/PolyA+ RNA,经 DNase I 去除基因组 DNA 后,用镁离子试剂将 RNA 片段化为 100-200 bp 短片段,再通过 T4 多核苷酸激酶修复 RNA 3' 端,为接头连接做准备。
2.3' 接头连接与纯化:给修复后的 RNA 连接特异性 3' 接头,用 5'- 脱腺苷酶和 RecJ 核酸酶清除多余游离接头,纯化获得带 3' 接头的 RNA。
3.2 - 溴丙烯酰胺特异性修饰:将 RNA 与 250 mM 2 - 溴丙烯酰胺、625 mM 磷酸盐缓冲液(pH8.5)混合,85℃孵育 30 分钟,使 Ψ 发生环化修饰形成 nce¹,²Ψ 产物,经两次纯化去除未反应试剂。
4.反转录合成 cDNA:加入 RT 引物和 dNTP,通过反转录酶合成 cDNA;用 Exo I 消化多余引物,再用 NaOH 水解 RNA 模板并中和,纯化得到 cDNA。
5.cDNA 接头连接与 PCR 扩增:给 cDNA 连接双链接头,进行 10-12 个循环的 PCR 扩增,纯化后获得可用于测序的文库。
6.测序与数据分析:测序,结合 NNΨNN/NNUNN 合成 spike-in 校准,通过公式计算 Ψ 修饰水平,同时识别 A-to-I 编辑和 m¹A 修饰信号。
1.位点定位精准:通过 Ψ-to-C 的单碱基突变信号,可精准区分 连续尿苷序列 和 密集修饰区域 。
2.定量准确性高:通过合成 spike-in 构建校准曲线,与金标准 SILNAS 质谱的定量相关性 r=0.90,且 256 种序列基序中 230 种的 Ψ 转化效率>85%。
3.多修饰同步检测:可在同一文库中同时检测 Ψ、A-to-I 编辑和 m¹A,实现 “一库多检”,无需额外构建多个文库,降低样本和试剂消耗。
1.样本需求量较高:实验需 50-200 ng 的 rRNA 或 polyA+ RNA,对低起始量样本(如微量临床样本)的兼容性不足,无法满足单细胞或微量体液样本的检测需求。
2.化学处理存在 RNA 降解风险:85℃的高温环化处理可能导致部分 RNA 片段降解,会轻微降低文库构建效率。
3.数据分析流程复杂:需结合 UMI 去重、基序特异性校准、多修饰信号区分等步骤,对生物信息学分析能力要求较高,且需定制化脚本(依赖 GitHub 开源代码),普通实验室难以快速复现。
(四)nanoRMS/NanoPsu
RNA 分子通过纳米孔时,会产生特征性电流强度信号;Ψ 作为尿苷(U)的异构体,其化学结构差异会导致两种关键信号变化 —— 一是碱基识别(base-calling)时出现特异性 “错误”(主要为 U→C 错配),二是电流强度和信号轨迹(trace)与未修饰 U 存在显著差异。通过专用软件(如 nanoRMS)提取单分子层面的电流强度、信号轨迹等特征,利用机器学习算法(KNN 或 K-means)区分 “修饰读段” 与 “未修饰读段”,统计修饰读段占比即可量化 Ψ 修饰比例;同时以敲除假尿苷合成酶(PUS)的菌株为对照,校准信号特异性。
1.样本制备与 RNA 提取:从细胞或组织中提取总 RNA 或富集 poly (A)+ RNA(适配 mRNA 检测),无需化学标记或抗体富集,保留 RNA 原生状态。
2.文库构建:对 RNA 进行 poly (A) 尾修饰(若为非 poly (A) RNA),连接纳米孔测序专用接头(RTA/RMX),形成 RNA:DNA 杂交链,无需 PCR 扩增,避免引入偏倚。
3.纳米孔测序:将文库加载到 ONT MinION 等测序平台,通过纳米孔实时检测 RNA 通过时的电流信号,获取单分子层面的原始信号数据(FAST5 格式)。
4.数据分析:先用 Guppy 等工具进行碱基识别(base-calling),筛选 Ψ 特有的 U→C 错配信号;再用 nanoRMS 软件提取电流强度、信号轨迹等特征,通过机器学习模型区分修饰与未修饰读段,最终输出 Ψ 位点定位及修饰比例。
1.无需化学修饰或抗体:直接检测原生 RNA,避免 CMC 标记、亚硫酸氢盐处理等步骤导致的 RNA 降解或偏倚,保留 RNA 天然修饰状态。
2.单分子分辨率与定量能力:既能定位 Ψ 位点(单碱基分辨率),又能通过单分子读段统计实现修饰比例定量(5%-100%),还可捕捉同一 RNA 分子上的多个修饰共存信息。
3.适配多种 RNA 类型:可检测 rRNA、tRNA、mRNA、snRNA/snoRNA 等多种 RNA 的 Ψ 修饰,还能同步分析 2′-O - 甲基化(Nm)等其他修饰。
4.实验流程简便:无需复杂文库构建步骤,避免 PCR 扩增,缩短实验周期,且能处理完整长度的 RNA 分子,保留异构体信息。
1.低丰度位点灵敏度不足:对 mRNA 等低丰度 RNA 中的低修饰比例位点(<10%)检测难度大,需极高测序深度(≥50 M reads),增加实验成本。
2.序列背景依赖性:部分序列上下文(如连续 U 或复杂二级结构区域)会干扰信号识别,导致假阳性或定位偏差,需结合其他技术验证。
3.数据分析复杂:依赖专用软件和机器学习模型,需校准碱基识别算法(如 Guppy)和映射工具(如 GraphMap),对生物信息学能力要求较高。
4.设备成本较高:需专用纳米孔测序平台(如 MinION),初期投入高于传统测序技术,且低修饰比例位点的定量准确性需依赖标准品校准。
下表是四种技术的对比: